Eléments de l'association
|
List of bibliographic references
Number of relevant bibliographic references: 19.Ident. | Authors (with country if any) | Title |
---|---|---|
000722 | Bruno Scherrer [France] ; Mohammad Ghavamzadeh [France] ; Victor Gabillon [France] ; Boris Lesner [France] ; Matthieu Geist [France] | Approximate Modified Policy Iteration and its Application to the Game of Tetris |
000936 | Bruno Scherrer [France] ; Matthieu Geist [France] | Local Policy Search in a Convex Space and Conservative Policy Iteration as Boosted Policy Search |
000B67 | Bruno Scherrer [France] ; Matthieu Geist [France] | Quand l'optimalité locale implique une garantie globale : recherche locale de politique dans un espace convexe et algorithme d'itération sur les politiques conservatif vu comme une montée de gradient fonctionnel |
000F64 | Matthieu Geist [France] ; Edouard Klein [France] ; Bilal Piot [France] ; Yann Guermeur [France] ; Olivier Pietquin [France] | Around Inverse Reinforcement Learning and Score-based Classification |
001057 | Lucie Daubigney [France] ; Matthieu Geist [France] ; Olivier Pietquin [France] | Particle Swarm Optimisation of Spoken Dialogue System Strategies |
001066 | Lucie Daubigney [France] ; Matthieu Geist [France] ; Olivier Pietquin [France] | Model-free POMDP optimisation of tutoring systems with echo-state networks |
001123 | Lucie Daubigney [France] ; Matthieu Geist [France] ; Olivier Pietquin [France] | Optimisation par essaims particulaires de stratégies de dialogue |
001220 | Lucie Daubigney [France] ; Matthieu Geist [France] ; Olivier Pietquin [France] | Random Projections: a Remedy for Overfitting Issues in Time Series Prediction with Echo State Networks |
001835 | Lucie Daubigney [France] ; Matthieu Geist [France] ; Senthilkumar Chandramohan [France] ; Olivier Pietquin [France] | A Comprehensive Reinforcement Learning Framework for Dialogue Management Optimisation |
001A58 | Matthieu Geist [France] ; Bruno Scherrer [France] ; Alessandro Lazaric [France] ; Mohammad Ghavamzadeh [France] | A Dantzig Selector Approach to Temporal Difference Learning |
001A91 | Lucie Daubigney [France] ; Matthieu Geist [France] ; Olivier Pietquin [France] | Optimisation d'un tuteur intelligent à partir d'un jeu de données fixé |
001B15 | Edouard Klein [France] ; Bilal Piot [France] ; Matthieu Geist [France] ; Olivier Pietquin [France] | Classification structurée pour l'apprentissage par renforcement inverse |
001B20 | Matthieu Geist [France] ; Bruno Scherrer [France] ; Alessandro Lazaric [France] ; Mohammad Ghavamzadeh [France] | Un sélecteur de Dantzig pour l'apprentissage par différences temporelles |
001B24 | Bruno Scherrer [France] ; Victor Gabillon [France] ; Mohammad Ghavamzadeh [France] ; Matthieu Geist [France] | Approximations de l'Algorithme Itérations sur les Politiques Modifié |
001B96 | Lucie Daubigney [France] ; Matthieu Geist [France] ; Olivier Pietquin [France] | Off-policy Learning in Large-scale POMDP-based Dialogue Systems |
001C55 | Lucie Daubigney [France] ; Matthieu Geist [France] ; Olivier Pietquin [France] | Apprentissage off-policy appliqué à un système de dialogue basé sur les PDMPO |
001F54 | Edouard Klein [France] ; Matthieu Geist [France] ; Olivier Pietquin [France] | Reducing the dimentionality of the reward space in the Inverse Reinforcement Learning problem |
002141 | Edouard Klein [France] ; Matthieu Geist [France] ; Olivier Pietquin [France] | Batch, Off-policy and Model-free Apprenticeship Learning |
002281 | Edouard Klein [France] ; Matthieu Geist [France] ; Olivier Pietquin [France] | Apprentissage par imitation dans un cadre batch, off-policy et sans modèle |
This area was generated with Dilib version V0.6.33. |